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摘要 :目的 基于 正常 和 恶性 胃 组 


织 介 电 特 性 值 的 差异 ,运用 支持 向 量 
头 法 测量 正常 和 恶性 胃 组 织 在 42.58~500 MHz 频率 范围 内 的 介 电 特 性 ,并 对 测 得 


量 机 ( un 电 特 性 进行 自动 鉴别 。 方 法 用 开端 同 轴 探 
多 介 电 特性 数据 进行 Cole-Cole 模 型 拟 合 。 接 


收 机 操作 特性 (ROC) 曲 线 分 析 法 被 用 来 对 各 频率 点 下 介 电 常数 .电导 率 和 Cole- 拟 合 参数 的 鉴别 能 力 进行 评估 。SVM 被 


用 来 对 正常 和 恶性 胃 组 织 进 行 鉴别 ,鉴别 正确 率 由 k 折 交叉 验证 进行 计算 。 结 果 在 测量 频率 范围 内 ,5 个 低 端 频率 点 下 介 电 常 


数 的 ROC 曲线 下 面积 达到 0.8 以 上 。 这 5 个 频率 下 介 电 常数 的 组 合作 为 特征 值 与 SVM 结合 取得 了 最 高 鉴别 正确 率 84.38%， 


MATLAB 运 行 时 间 为 3.40 s。 结 论 本 文 提出 的 基于 介 电 特性 的 恶 


关键 词 : 介 电 特性 ;恶性 胃 组 织 ;鉴别 ;ROC 曲线 ;支持 向 量 机 


性 人 体 骨 组 织 支 持 向 量 机 辅助 诊断 方法 具有 可 行 性 。 
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Abstract: Objective To achieve differential diagnosis of normal and malignant gastric tissues based on discrepancies in their 


dielectric properties using support vector machine. Methods The dielectric properties of normal and malignant gastric tissues 
at the frequency ranging from 42.58 to 500 MHz were measured by coaxial probe method, and the Cole-Cole model was used 


to fit the measured data. Receiver-operating characteristic (ROC) curve analysis was used to evaluate the discrimination 
capability with respect to permittivity, conductivity, and Cole-Cole fitting parameters. Support vector machine was used for 
discriminating normal and malignant gastric tissues, and the discrimination accuracy was calculated using k-fold 


cross-validation. Results The area under the ROC curve was above 0.8 for permittivity at the 5 frequencies at the lower end of 
the measured frequency range. The combination of the support vector machine with the permittivity at all these 5 frequencies 


combined achieved the highest discrimination accuracy of 84.3876 with a MATLAB runtime of 3.40 s. Conclusion The support 


vector machine-assisted diagnosis is feasible for human malignant gastric tissues based on the dielectric properties. 
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Ed 固有 属性 ,包括 介 电 常数 se 
和 电导 率 g 。 人 体 组 织 的 介 电 特 性 值 与 组 织 自 身 的 
水 含量 EURA 含量 及 离 2 ,与 组 织 
所 处 的 微 循 环 等 微 环 境 有 关 , 并 且 具 有 频率 依赖 性 。 当 
组 织 发 生 瘤 变 的 时 候 , 上 述 介 电 特性 相关 因素 会 发 生 改 
变 , 进 而 导致 正常 和 恶性 组 织 的 介 电 特性 值 之 间 存 在 较 
为 显著 的 差异 **”。 理 论 上 ,正常 和 恶性 组 织 的 介 电 特 
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性 值 之 间 的 差异 ,在 组 织 形态 学 改变 之 前 就 已 经 存在 ， 
因此 可 能 会 成 为 早期 发 现 癌变 可 疑 部 位 的 一 种 新 的 技 
术 方 法 ,发 现 可 疑 部 位 后 再 有 针对 性 地 实施 活检 ,有 可 
能 实现 癌症 的 早期 诊断 。 
Gabriel 等 “系统 地 研究 了 健康 人 体 组 织 的 介 电 特 

性 频率 谱 , 并 且 建 立 了 人 体 正常 组 织 介 电 特 人 B 
同时 对 正常 和 恶性 生物 组 织 的 介 电 特性 进行 测量 ,显示 
iE 常 和 恶性 组 织 之 间 的 介 s 隆 的 差异 通常 显著 2 

这 表明 确实 可 能 通过 这 种 差异 来 实现 组 织 良 亚 4 m 
别 。 但 是 ,目前 还 没有 明确 的 标准 指出 ,组 织 的 介 电 特 
性 差异 达到 多 大 , 即 可 判断 为 可 疑 的 癌变 组 织 。 he 
研究 通过 组 织 介 电 特性 差异 的 程度 来 判断 组 织 良 亚 ; 
的 判别 方法 具有 重要 的 意义 。 为 此 ,已 经 有 学 者 开展 了 
相关 研究 工作 。 其 中 ,Truong 等”““ 在 THz 频 率 下 , 基 
于 正常 和 恶性 组 织 介 电 特 性 的 差异 ,分 别 用 机 器 学 习 的 
方法 对 乳腺 和 皮肤 的 正常 和 恶性 组 织 进 行 鉴别 , 且 对 两 
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种 组 织 的 鉴别 正确 率 最 高 均 达 到 90% 以 上 ;Yilmaz 等 25 
在 500 MHz~6 GHz 频率 范围 内 测量 老鼠 正常 和 恶性 肝 
组 织 的 介 电 特 性 ,然后 用 机 器 学 习 的 方法 进行 鉴别 ,并 
取得 了 高 于 90% 的 鉴别 正确 率 。 然 而 ,目前 还 未 见 文献 
报导 基于 介 电 特性 差异 自动 鉴别 人 体 正常 和 恶性 的 胃 
组 织 的 方法 。 本 文采 用 开端 同 轴 探头 法 在 临床 手术 室 
中 测量 人 体 胃 部 正常 和 癌变 组 织 在 42.58~500 MHz 频 
率 范围 内 的 介 电 特性 ,探索 采用 机 器 学 习 方法 自动 鉴别 
正常 和 恶性 胃 组 织 的 可 行 性 。 利 用 统计 分 析 方 法 中 的 
接收 机 操作 特性 (ROC) 曲 线 来 判断 采用 多 种 参数 对 介 
电 特性 进行 鉴别 的 能 力 ,并 从 中 选 出 鉴别 能 力 较 高 的 参 
数 作 为 机 器 学 习 分 类 的 特征 值 来 完成 基于 机 器 学 习 方 法 
的 自动 鉴别 。 鉴 于 本 文 的 数据 为 数值 型 ,日 属 于 二 分 类 
问题 ,我 们 选择 支持 向 量 机 (SVM) 来 对 正常 和 恶性 胃 
组 织 进 行 鉴别 。 


1 材料 和 方法 
1.1 数据 介绍 


本 研究 采用 开端 同 轴 探 头 法 …" ,在 手术 室 测量 新 
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图 1 Cole-Cole 拟 合 结果 图 例 


鲜 切 除 的 人 体 亚 性 胃 组 织 及 其 周 于 正常 组 织 的 介 电 特 
性 。 测 量 的 频率 范围 为 42.58~500 MHz, 共 计 43 个 频 
率 点 。 共 测量 了 来 自 26 例 病人 的 290 个 样本 ,其 中 包括 
100 个 正常 样本 和 190 个 恶性 样本 ,病人 年 龄 在 36~80 
岁 之 间 , 离 体 测量 的 温度 范围 为 23.8~32.8 C 。 

本 文 也 对 测 得 的 胃 组 织 的 介 电 特 性 进行 Cole-Cole 
模型 拟 合 "2 ,下 式 是 单 极 Cole-Cole 拟 合 公式 : 


&(o)7e(o)-je(o) ^e, 


BB e qq 

1 * ( jo) JOE 
其 中 , w 是 角 频 率 , e(o) 是 样本 依赖 频率 的 复 介 
电 常 数 数据 , e (o) 是 依赖 频率 的 介 电 常 数 , e(o) 是 依 
赖 频 率 的 介 电 损耗 (可 以 转换 为 电导 率 : 
c(o) 7 eee (o) ),s。 .o, ~ Ae, t 和 a 是 根据 实验 数据 
估算 出 的 Cole-Cole 模 型 拟 合 参数 。Cole-Cole 拟 合 的 
具体 操作 是 使 用 文献 中 提出 的 软件 包 来 实现 的 2 。 网 1 
显示 的 是 两 个 不 同样 本 (分 别 是 正常 和 恶性 组 织 ) 的 原 

会 则 量 数据 及 Cole-Cole 拟 合 曲线 。 

这 样 ,每 个 样本 都 包括 43 个 频率 下 的 介 电 常 数 和 
电导 率 , 以 及 5 个 Cole-Cole 拟 合 参 数 。 这 些 介 电 特性 
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Fig.l Example of Cole-Cole fitting results. A, B: Fitting graphs of permittivity and conductivity of normal tissue 
with frequency, respectively; C, D: Fitting graphs of permittivity and conductivity of malignant tissue with 


frequency, respectively. 
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值 和 拟 合 参数 将 用 于 下 一 步 的 ROC 曲线 分 析 ,以 判断 
其 鉴别 能 力 。 
1.2 ROC 曲线 分 析 

ROC 曲线 产后 分 析 是 组 织 分 类 器 和 可 视 化 其 性 能 
的 一 种 有 用 技术 ,通常 用 于 医疗 决策 ,近年 来 被 来 越 来 
越 多 的 在 机 器 学 习 和 数据 挖掘 领域 使 用 。ROC 曲线 图 
是 二 维 图 ,其 横 坐 标 代 表 假 阳性 率 , 纵 坐标 代表 真 阳性 
率 ,曲线 上 的 每 个 点 对 应 着 一 个 判决 阔 值 。 作 为 ROC 
曲线 分 析 的 一 个 关键 指标 ,ROC 曲线 下 面积 (AUC) 不 
依赖 任何 阔 值 ,其 值 在 0.5$~1 之 间 。AUC 越 接近 1, 代 表 
鉴别 能 力 越 高 。 

本 研究 运用 ROC 曲线 来 判断 每 一 个 测量 频率 下 的 
介 电 常数 .电导 率 , 以 及 5 个 Cole-Cole 拟 合 参 数 各 自 的 
鉴别 能 力 , 从 而 找到 鉴别 能 力 较 高 的 特征 值 用 于 接 下 来 
的 机 器 学 习 鉴 别 研究 。 
1.3 SVM 介绍 

SVM 是 建立 在 统计 学 习 理 论 的 VC 维 理论 和 结 
构 风 险 最 小 化 原理 基础 上 的 一 种 机 器 学 习 方法 。 目 前 已 
有 不 少 文献 提 到 用 SVM 来 鉴别 正常 和 恶性 组 织 ”“5。 
本 文 运用 二 分 类 SVM ,通过 训练 样本 找到 最 优 超 平面 ， 
将 正常 和 恶性 胃 组 织 分 开 在 超 平面 的 两 侧 , 并 利用 该 超 
平面 对 测试 样本 进行 分 类 。 


X (xx, 代表 训练 样本 集 , 其 中 工 是 样本 
个 数 , x,e R"(11,2,...,L) 表示 一 个 样本 , 即 特征 向 


f, ie[-1,1) ,其 中 ;= 1 代表 恶性 组 织 , i=-1 代 表 正 常 
组 织 。 由 支持 向 量 决定 的 超 平面 wx+b=1 和 
wx+b=-1 之 间 的 距离 为 2/lhwl , 求 2/lwl 的 最 大 值 即 
SR Iw 的 最 小 值 。 这 样 , 找 最 优 超 平面 可 通过 最 小 化 
hu 省 来 进行 。 另 外 ,训练 样本 中 可 能 会 含有 少量 的 噪声 
样本 ,为 使 超 平面 不 受 噪声 信号 的 影响 ,这 里 引入 松弛 
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— Frequency 1 
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Frequency 3 
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变量 5 。 最 终 , 找 最 优 超 平面 的 问题 可 转化 为 如 下 的 数 


学 问题 : 
L 
min, wl + CY z (2) 
1-1 


i(wx,*b)21-6, 020, 1=1,2,...,L (3) 

式 中 ,C 为 惩罚 因子 ,决定 对 错 分 样本 的 惩罚 程度 ， 
影响 分 类 器 对 测试 样本 的 鉴别 正确 率 。 

上 述 约束 优化 问题 由 Lagrangian PRZICRAE 77" 。 

通过 比较 线性 核 隐 数 ,多 项 式 核 函 数 . 径 向 基 核 函 
数 等 几 种 常用 核 函 数 的 鉴别 效果 ,本 文 决定 采用 高 斯 径 
向 基 核 函数 ”” ,其 表达 式 为 : 

K(x,x) exp (-glx- xl), g>0 (4) 

上 述 惩罚 因子 C 和 核 函 数 中 参数 g 是 影响 SVM 分 
类 器 性 能 的 关键 参数 ,需要 对 其 进行 寻 优 。 本 文采 用 的 
参数 寻 优 法 为 网 格 搜索 法 ”。 鉴 别 正确 率 采用 k 折 交 


又 验 证 ”进行 计算 。 
2 结果 


ROC 曲线 分 析 和 SVM 鉴 别 分 别 由 SPSS 21.0 软 件 
和 MATLAB R2014a 软 件 来 实现 ,本 节 将 对 实验 结果 进 
行 详细 描述 。 

图 2A 和 B 分 别 展 示 了 所 有 测量 频率 点 下 的 介 电 常 
数 和 电导 率 对 应 的 ROC 曲 线 。 图 中 对 角 线 的 AUC 为 
0.5, 代 表 没 有 鉴别 能 力 。 可 以 看 出 ,所 有 频率 下 介 电 常 
数 和 电导 率 的 ROC 曲线 都 完全 在 对 角 线 上 方 。 图 3 显 
示 的 是 图 2 中 所 有 ROC 曲线 对 应 的 曲线 下 面积 ,所 有 频 
率 下 介 电 常数 和 电导 率 的 AUC 均 在 0.7 以 上 , 且 只 有 在 
42.58、53.23 .63.87、74.52 和 85.16 MHz 这 5 个 频率 下 的 
介 电 常数 的 AUC 超 过 0.8。 

图 4 展示 了 5 个 Cole-Cole 拟 合 参数 对 应 的 ROC 曲 
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图 2 所 有 测量 频率 点 下 的 介 电 常数 和 电导 率 对 应 的 ROC 曲线 


Fig.2 ROC curves of permittivity (A) and conductivity (B) at all the measured frequency points. 
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图 3 所 有 测量 频率 点 下 的 介 电 常数 和 电导 率 对 应 的 
ROC 曲线 下 面积 

Fig.3 Area under the ROC curves of permittivity and 
conductivity at all the measured frequency points. 


线 , 可 以 看 出 5 条 曲线 均 在 对 角 线 附近 ,日 参数 e,、As 、 
t.a 和 Go 各 自 对 应 的 ROC 曲 线 下 面积 为 0.629、0.671、 
0.616.0.676 和 0.544。 

根据 以 上 ROC 曲线 分 析 的 结果 ,我 们 选取 AUC 超 
过 0.8 的 5 个 频率 下 的 介 电 常数 (依次 记 作 sn 、sm、sn、 
s# 和 ss) 及 其 组 合作 为 分 类 特征 值 , 结 合 SVM 分 类 需 
来 鉴别 正常 和 恶性 的 胃 组 织 。 以 5 个 频率 下 介 电 常数 
的 组 合 为 例 : 

使 用 传统 的 网 格 搜 索 法 : 设 定 C 和 g 均 在 [2",2"] 


Accuracy (%) 


10 Accuracy=82.8125% _ 
5 > 
0 MES 
Es F 
Log2g b X -5 Log2c 


图 5 SVM 参数 选择 结果 


4 5 个 Cole-Cole 拟 合 参数 对 应 的 ROC 曲线 
Fig.4 ROC curves for 5 Cole-Cole fitting parameters. 


范围 内 ,以 步 距 为 0.5 进 行 寻 优 , 耗 时 14.88 s。 使 用 改进 
的 网 格 搜索 法 :首先 粗略 寻 优 , 设 定 C 和 g 的 寻 优 范围 均 
为 [2",2"], 步 距 均 为 2, 得 到 局 部 最 优 参 数组 合 (C,g) 
为 (256,1), 对 应 5 折 交 叉 验 证 正 确 率 为 82.81%; 然 后 进 
行 精细 寻 优 ,在 得 到 的 局 部 最 优 参数 附近 ,重新 定义 搜 
索 范 围 和 步 距 ,其 中 C 的 取 值 范围 为 [2’,2"], 步 距 为 
0.5,g 的 取 值 范围 为 [23,2], 步 距 也 为 0.5, 得 到 最 优 参 
数组 合 (C,g) 为 (362.0387,8), 对 应 5 折 交 又 验证 正确 率 
为 84.38%。 整 个 过 程 耗 时 3.40 s。 图 5(A) 和 (B) 分 别 
展示 了 粗略 寻 优 和 精细 寻 优 的 结果 图 。 
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Fig.5 Results of SVM parameter selection. A: Rough search results with grid search method; B: Fine search results with 


grid search method. 


表 1 展 示 了 不 同 参数 组 合 对 应 的 SVM 鉴别 正确 率 
和 在 MAILAB 中 的 运行 时 间 。 同 一 参数 组 合 对 应 的 传 
统 网 格 搜索 法 和 改进 网 格 搜索 法 的 鉴别 正确 率 一 致 ; 改 


进 网 格 搜索 法 的 运行 时 间 低 于 传统 网 格 搜索 法 ;5 个 频 
率 下 介 电 常数 组 合 的 鉴别 正确 率 最 高 , 且 相 对 于 单个 频 
率 下 的 介 电 常数 并 没有 增加 MATLAB 运 行 时 间 。 
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表 1 不 同 参数 组 合 下 SVM 鉴别 结果 


Tab.1 SVM discrimination results based on combination of different parameters 


Traditional grid search 


Improved grid search 


Combination of parameters 


Accuracy (96) Time (s) Accuracy (96) Time (s) 
En 81.64 27.96 81.64 3.50 
En 79.69 25.26 79.69 3.43 
£5 78.13 31.15 78.13 3.63 
Sa 71.34 29.11 71.34 4.02 
Es 75 24.47 75 3.36 
(en,Enp, Ep, En, Ep) 84.38 14.88 84.38 3.40 


3 讨论 

生物 组 织 的 介 电 特性 值 随 着 生理 或 病理 状态 的 改 
变 而 改变 六 ,目前 已 有 大 量 文献 报道 了 对 正常 和 恶性 生 
物 组 织 介 电 特 性 值 的 测量 ,并 且 证 明了 二 者 具有 显著 差 
异 *2 ,但 是 并 没有 具体 分 析 不 同 频率 点 下 的 介 电 稼 
Zi .电导 率 以 及 Cole-Cole 拟 合 参 数 的 鉴别 能 力 。 近 几 
年 有 少数 文献 开始 基于 介 电 特性 用 机 器 学 习 算 法 来 对 
正常 和 恶性 生物 组 织 进行 鉴别 汪汪 ,但 是 目前 尚未 见 文 
献 用 该 方法 对 恶性 人 体 胃 组 织 进 行 自动 辅助 诊断 。 本 
文 在 测量 人 体 正常 和 恶性 胃 组 织 介 电 特 性 的 基础 上 , 运 
用 ROC 曲 线 分 析 各 参数 的 诊断 能 力 ,并 选 出 诊断 能 力 
较 高 的 参数 , 同 支持 向 量 机 结合 来 对 恶性 胃 组 织 进行 辅 
助 诊断 鉴别 ,并 从 鉴别 正确 率 和 MATLAB 运 行 时 间 上 
进行 了 分 析 。 

本 研究 测量 了 42.58 MHz~500 MHz 频 率 范围 内 
43 个 频率 点 下 正常 和 恶性 胃 组 织 的 介 电 常数 和 电导 率 ， 
并 用 Cole-Cole 模 型 对 测量 数据 进行 拟 合 。 通 过 ROC 则 
线 分 析 各 频率 下 介 电 常数 .电导 率 , 以 及 5 个 Cole-Cole 
拟 合 参数 的 鉴别 能 力 。ROC 曲线 分 析 结 果 显 示 ,所 有 
测量 频率 点 下 的 介 电 常 数 和 电导 率 的 ROC 曲线 下 面积 
都 大 于 0.7, 而 5 个 Cole-Cole 拟 合 参 数 对 应 的 ROC 曲线 
下 面积 都 低 于 0.7, 因 此 Cole-Cole 拟 合 参数 的 鉴别 能 
低 于 介 电 常数 和 电导 率 。 另 外 ,对 比 不 同 频率 点 下 的 介 
电 常 数 和 电导 率 , 发 现 只 有 在 42.58 ,53.23 63.87、74.52 
和 85.16 MHz 这 5 个 低 端 频率 下 介 电 党 数 的 ROC 曲线 
下 面积 超过 0.8, 说 明 其 具有 较 高 的 鉴别 能 力 。 根 据 
ROC 曲线 分 析 结 果 ,最终 选 择 鉴 别 能 力 较 高 的 5 个 频率 
下 的 介 电 常数 及 其 组 合作 为 分 类 特征 值 ,结合 SYM 来 
鉴别 正常 和 恶性 胃 组 织 。SVM 鉴别 结果 显示 ,5 个 参数 
的 组 合 (en ,ep， cs， Eas Ej) 作 为 特征 值 时 取得 了 最 高 
鉴别 正确 率 84.38%, 且 改进 网 格 搜索 法 的 MATLAB 运 
行 时间 为 3.40 s, 相 对 于 5 个 参数 单独 作为 特征 值 并 没 
有 增加 MATLAB 运 行 时 间 。 因 此 ,在 今后 的 研究 中 ,可 
以 尝试 通过 测量 鉴别 能 力 较 高 的 几 个 频率 点 或 者 较 小 


频率 范围 内 的 介 电 尝 数 ,结合 改进 网 格 搜索 法 进行 参数 
寻 优 的 SVM 来 辅助 诊断 恶性 胃 组 织 ,从 而 避免 宽频 带 
数据 测量 以 及 Cole-Cole 拟 合 操作 。 这 样 可 以 节省 大 量 
时 间 ,增加 术 中 实时 辅助 诊断 的 可 行 性 。 

本 文 最 终 的 鉴别 正确 率 和 MATILAB 运行 时 间 表 
明 , 基 于 介 电 特性 的 人 体 恶 性 胃 组 织 支持 向 量 机 辅助 诊 
断 作为 一 种 新 的 重大 疾病 辅助 诊断 方法 具有 可 行 性 。 
然而 由 于 病人 的 性 别 .年 龄 .肿瘤 分 期 等 因素 尚未 考虑 
在 内 ,以 及 离 体 测量 的 影响 ,本 文 的 鉴别 正确 率 还 没有 
达到 最 高 。 接 下 来 的 研究 将 在 扩大 样本 数据 量 的 基础 
上 ,考虑 上 述 因素 ,并 找到 更 好 的 参数 组 合 , 从 而 进一步 
提高 诊断 正确 率 和 时 效 性 。 
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